开发者让 Codex「审」另一个 AI agent 写的代码,近万人围观:别让同一个大脑既当裁判又当运动员!
开发者让 Codex「审」另一个 AI agent 写的代码,近万人围观:别让同一个大脑既当裁判又当运动员!一个开发者公开了自己的工作流:让 OpenAI Codex 专门去审查 Hermes agent 写出来的代码,理由只有一个——审稿人不能和写稿人共享同一套记忆。这条推文引发了近万次浏览,背后藏着一个 agent 工程化的新趋势:多模型协作的价值,可能在于互相制衡。
搜索
一个开发者公开了自己的工作流:让 OpenAI Codex 专门去审查 Hermes agent 写出来的代码,理由只有一个——审稿人不能和写稿人共享同一套记忆。这条推文引发了近万次浏览,背后藏着一个 agent 工程化的新趋势:多模型协作的价值,可能在于互相制衡。
近日,全球具身世界模型权威基准评测 WorldArena 正式更新最新榜单。Manifold AI 流形空间研发的世界模型 WorldScape 0.2,凭借其在物理规律遵循与多源交互理解上的突破取得 WorldArena 榜单全球第一,充分展现了国产世界模型在复杂动态场景生成与具身控制中的高精度、强泛化与物理可信度。与其同场竞技的包括英伟达、谷歌等国外巨头和星动纪元、极佳视界等国内具身智能公司。
在真正熟悉3D高斯泼溅技术的圈子里,“大规模3D高斯模型在移动端打开” 的技术早已不是什么新鲜事。两年前就有一家深圳创业公司,做出来并推出完整产品,甚至开源至GitHub。
2026 年的 AI 行业不断加速,仿佛只有一个正确答案:卷 Agent,卷效率,卷生产力。跑得慢的人都在补课,跑得快的人已经在找下一个风口了。但在京东 JoyInside 首届「AI 终端新物种」硬件创新大赛的现场,几个与提升效率完全无关的产品,却让我十分好奇。
两天前,Creati AI推出了新产品Buzzy。Buzzy是一个专门做视频修改的AI Agent。用户可以对视频说“把这个人换成我的脸”“把阴天变成黄昏”“去掉背景里的路人”,局部修改,其他不动。几乎同时,公司官宣了由红点领投的B轮融资,金额高达2000万美元。
SentiPulse(思维光谱)公测了一款叫 SentiCat 的产品,把这套理念落了地。一个有 Live2D 形象、有性格的数字角色 SUSU,负责陪你聊天、了解你、跟你建立关系;她的“AI 小猫”,负责写 PPT、查资料、改代码,脏活累活归它。
4月27日消息,智能纪元AGI独家获悉,阿里云和美团联合创始人王慧文投资的AI Infra公司硅基流动联合创始人、增长业务副总裁杨攀近期从硅基流动离职,正考虑再次创业。
最近试用了一款上线的产品——Moxt,一个 Agent-Native Workspace。它要解决的正是这个问题:给团队加一排 AI 工位。这些 AI 员工能写报告、做研究、写代码、搭看板、跑自动化流程,7×24 小时在线,和真人团队在同一个工作空间里协作。更重要的是,能直接接入飞书和 Slack,在你熟悉的聊天窗口里被 @ 唤起干活。
在消耗了无数张 GPU 资源、烧掉了够几座城市用一年的电力之后,OpenAI 最新推出的 AI 生图大模型 GPT-Image-2,再次迎来了它人生中的高光时刻——给人类看手相/面相。
美国国安局一直在使用 Mythos,白宫还准备把这个「修改版」模型推向更多联邦机构。五角大楼把 Anthropic 定义为「供应链风险」,联邦安全部门却已离不开它。美国对前沿 AI 的态度,开始在争议中转向接入和管控。